Online problémy v strojovom učení

نویسنده

  • Dávid Pál
چکیده

Online strojové učenie je matematický model, kde agent robí predpovede zároveň s tým ako prijíma dáta. Kl’účovým faktorom je rýchlost’ konvergencie agenta k optimálnemu offline riešeniu. Zrekapitulujem niekol’ko klasických problémov: učenie sa s pomocou expertov, problém mnohorukého banditu. Načrtnem súvislosti s inými oblast’ami aplikovanej matematiky: gradientné metódy z optimalizácie, opakované hry a kompetitívna analýza online algoritmov. V druhej časti sa budem zaoberat’ opakovanými hrami s neúplnou informáciou, čo je zovšeobecnenie predchádzajúcich modelov. Pred dvoma rokmi sme ja, András Antos, Gábor Bartok, Dean Foster, Alexander Rakhlin, a Csaba Szepesvari klasifikovali všetky konečné opakované hry s neúplnou informáciou podl’a minimax rýchlosti ich konvergencie. Vysvetlím štruktúru rôznych typov hier tejto klasifikácie.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Možnosti Vývoje Inteligence

je základem pro pokrok v učení a vývoj různých dovedností, zároveň umožňuje

متن کامل

Learning by Bidding: Evidence from a Large-scale Natural Experiment

Learning is a subject of intense research in experimental economics. We contribute to this debate by presenting persuasive evidence that learning took place among uninformed heterogeneous agents on a quasi-stock market during a large-scale natural experiment that by size, incentives, and variation belongs among the largest experiments ever conducted. To detect and quantify learning we develop n...

متن کامل

Alternatívy k MILP pre rozvrhovanie dávkových banských procesov

Alternatívy k MILP pre rozvrhovanie dávkových banských procesov Cieľom príspevku je navrhnúť možnosť, nahradenia optimalizačných metód na báze zmiešaného celočíselného programovania použitím približných metód rozhodovania (heuristika) v oblasti plánovania a riadenia banských procesov. Výsledkom tohto počítačom podporaovaného plánovania sú detailné výrobné rozvrhy vytvorené podľa požiadaviek ako...

متن کامل

Mı́ry a lineárnı́ maticové nerovnosti v optimálnı́m polynomiálnı́m řı́zenı́ Measures and linear matrix inequalities in polynomial optimal control Summary

Míry a lineární maticové nerovnosti v optimálním polynomiálnímřízení Measures and linear matrix inequalities in polynomial optimal control Summary This lecture describes the application of modern techniques of convex optimization to solve nonconvex nonlinear optimal control problems (OCPs) which may feature oscillation phenomena (chattering control) or concentration phenomena (impulsive control...

متن کامل

Hybridization of Evolutionary Algorithms Using Different Evaluation Approaches

Tato práce je zaměřena na výzkum evolučních algoritmů kombinujícíh moderní přístup v evolučním počítání, zvaný novelty search, s klasickým přístupem založeným na optimalizaci fitness. Novelty search je v této práci analyzován spolu s jedním dosavadním přístupem který již novelty search a fitness kombinuje a jsou zmíněny jejich výhody a nevýhody. Na základě této analýzy jsou navrhnuty dva nové h...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013